大模型算力困境有解!LightThinker学人脑,让AI学会高效思考
随着AI技术的迅猛发展,大语言模型(LLMs)在处理复杂推理任务中表现出色,却因生成的中间步骤繁琐而导致计算效率低下的问题。从我们所熟知的思维链(CoT)到更高级的深度思考模式(Thinking),AI的回答正变得愈发精准且值得信赖。但这种进步并非无懈可击,模
模型 推理 人脑 令牌 lightthinker 2025-09-23 11:41 5
随着AI技术的迅猛发展,大语言模型(LLMs)在处理复杂推理任务中表现出色,却因生成的中间步骤繁琐而导致计算效率低下的问题。从我们所熟知的思维链(CoT)到更高级的深度思考模式(Thinking),AI的回答正变得愈发精准且值得信赖。但这种进步并非无懈可击,模
模型 推理 人脑 令牌 lightthinker 2025-09-23 11:41 5
DeepSeek官方宣布DeepSeek-V3.1更新至 DeepSeek-V3.1-Terminus 版本。
这项由Meta FAIR实验室的陈德龙(Delong Chen)、Théo Moutakanni等研究人员领导的研究发表于2025年9月,研究论文可通过arXiv:2509.02722v2访问。有兴趣深入了解的读者可以关注这一突破性的人工智能规划技术进展。
要理解这项研究的意义,我们先来看一个真实发生的故事。2024年,加拿大航空公司因为其聊天机器人错误地向客户承诺退款而被法院要求承担责任。这个事件完美诠释了当前AI守护系统的局限性:现有的守护模型就像一个只会按固定条款执行的保安,它们只能识别一些通用的有害内容,
这项由香港科技大学(广州)、广东工业大学和StepFun AI联合开展的研究发表于2025年8月,论文作者包括谢元、陈天水、葛正和倪亮等研究者。这项开创性研究首次将多轮推理机制引入长视频理解领域,提出了Video-MTR框架。有兴趣深入了解的读者可以通过arX
通过大规模强化学习实现智能密度最大化,Grok 4 Fast 在基准测试上实现了与 Grok 4 相当的表现。同时由于推理任务的平均 token 消耗减少了 40 %,xAI 此次更新将前沿模型的调用成本大幅降低。
这项由Amazon和伊利诺伊大学厄巴纳-香槟分校的叶晨路领导的研究团队最新成果,发表于2025年9月的arXiv预印本平台(论文编号:arXiv:2509.03403v1),为解决人工智能数学推理中的一个关键难题提供了突破性方案。有兴趣深入了解的读者可以通过h
这项由CAMEL-AI组织的国际研究团队完成的大规模研究发表于2025年9月,论文题目为《Loong: Synthesize Long Chain-of-Thoughts at Scale through Verifiers》。研究团队由来自CAMEL-AI.
在大模型竞赛围绕参数规模和跑分展开时,美团发布的新一代大模型选择了一条不同的路径:一切围绕能否真正解决问题展开。它不仅在国际权威的数学、代码测评中达到了顶级水平,更在晚上吃什么?礼物怎么选?这类具体而微小的生活难题中,展现出理解力和实用性。本文将结合技术报告与
根据TrendForce集邦咨询最新研究,未来两年AI基础设施的建置重心将更偏向支持高效能的推理(Inference)服务,在传统大容量HDD严重供不应求的情况下,CSP业者纷纷转向NAND Flash供应商寻求解方,催生专为Inference AI(AI推理
推理 ssd ai nearlinessd nearline 2025-09-22 18:08 6
根据TrendForce集邦咨询最新研究,未来两年AI基础设施的建置重心将更偏向支持高效能的推理服务,在传统大容量HDD严重供不应求的情况下,CSP业者纷纷转向NAND Flash供应商寻求解方,催生专为AI推理设计的Nearline SSD(近线固态硬盘),
推理 ssd ai推理 nearlinessd nearli 2025-09-22 17:13 10
【机构:AI推理催化大容量储存产品结构性改变 Nearline SSD需求急升】《科创板日报》22日讯,根据TrendForce集邦咨询最新研究,未来两年AI基础设施的建置重心将更偏向支持高效能的推理服务,在传统大容量HDD严重供不应求的情况下,CSP业者纷纷
推理 ssd ai推理 nearlinessd nearli 2025-09-22 17:05 10
今天,美团 LongCat 团队正式发布全新高效推理模型 LongCat-Flash-Thinking。在保持了 LongCat-Flash-Chat 极致速度的同时,全新发布的 LongCat-Flash-Thinking 更强大、更专业。综合评估显示,Lo
2025年9月22日,《鹅鸭杀》手游官方正式发布最新预告KV,宣布“鸭轴”测试将于9月28日启动。本次测试为不限号删档测试,无需激活码,所有玩家皆可参与,这也标志着游戏距离正式上线更近一步。
随着ChatGPT、DeepSeek等AI的兴起, 2024年中国智能算力规模达640.7EFLOPS。根据IDC数据,2024年中国AI服务器市场规模将突破190亿美元,同比增长87%;对应智能算力规模达到640.7百亿次/秒(EFLOPS)。2026年中国
1991年,身为公务员的依井贵裕在机缘巧合下参与了推理小说选拔赛,
在和孩子们相处的日子里,我发现家长们在给孩子选玩具这件事上,常常犯难。现在电子产品泛滥,孩子很容易就沉迷其中,视力下降。就像我接触过的一些家长,孩子一有空就抱着手机、平板玩,眼睛都开始出问题了,家长们特别着急,想找能替代电子产品的玩具。 而且,现在大家工作都忙
梁文锋等介绍如何结合强化学习(RL)[1]提升模型推理能力,把DeepSeek-V3 Base[2]升级到DeepSeek-R1的工作近日发表在Nature[3]。
推理 et deepseek 文锋 deepseek推理 2025-09-21 02:00 7
近日,由中国计算机学会(CCF)推荐的A类学术会议、人工智能领域顶级国际会议之一“NeurIPS 2025”(神经信息处理系统大会)公布论文录用结果。中国电信人工智能研究院(TeleAI)共有7项成果成功入选,重点聚焦正激励噪声(Pi/π-Noise, Pos
《能面检察官》是由村上牧人、七高刚、室井岳人联合执导,中山七里、荒井修子、鹿目庆子、三浦骏斗担任编剧,上川隆也主演的日本法律推理剧,改编自中山七里的《能面検事》系列小说。该剧于2025年7月11日起在东京电视台每周五9时档首播。